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Концептуализация и проблематика онтологий 


Статья посвящена анализу и обобщению концептуальных основ применения онтологий в процессах 
создания информационных систем. Рассматриваются состав и архитектура онтологий как основы 
семантического Веба, в котором особое внимание уделяется понятию баз знаний как центрального 
компонента интеллектуальной информационной системы в Интернете. Приведены примеры 
выполненных и актуальных проектов по тематике онтологий, которые реализуются в академических 
лабораториях и вузах Украины, сформулированы также основные проблемы в сфере знание- 
ориентированных систем и направления их решения. 


Теория искусственного интеллекта (ИИ) имеет многолетнюю историю и разветв- 
ленную архитектуру как наука. Следует отметить, что за последние 20 лет наиболее 
интенсивные изменения произошли в интеллектуальных науках тех направлений, 
которые соотносятся и соприкасаются с Интернетом. В названном контексте можно 
сформулировать основную цель данной статьи — проанализировать и обобщить новые 
концепции Интернета, проявившиеся в так называемом семантическом Вебе с позиций 
ИИ. Одним из способов достижения поставленной цели, на наш взгляд, может стать 
решение двух задач: первая — расширить понимание существующей теории ИИ, ее наи- 
более важных понятий и методологий в направлении семантического Веба, а вторая — 
осмыслить концепции и основные противоречия онтологических подходов как основ- 
ной идеологии распределенных в Интернете знание-ориентированных систем. 

Следует признать, что наука ИИ как совокупность многих его направлений разви- 
вается неравномерно и в последние годы для ряда традиционных разделов, если подойти 
критически, следует признать, что достижения довольно скромные. 

При этом, как уже было отмечено выше, сегодня значительно активизируются 
исследования на стыке с Интернетом. Уверенно в научную терминологию вошли 
такие понятия, как «семантический Веб», «интеллектуальные сети», «распределенные 
информационные системы», «мультиагентные системы» и одновременно расширился 
теоретико-методологический аппарат знание-ориентированных наук и технологий. 
В данном контексте следует отметить направления исследований универсальных языков, 
ХМГ-систем, таксономий и онтологий, которые в комплексе создали довольно стройную 
систему развития следующих поколений Интернета, включая идею семантического Веба, 
ставшего катализатором создания глобального информационного общества [1]. Реализа- 
цию семантического Веба можно считать практическим воплощением сетевой парадигмы 
искусственного интеллекта. Значение Интернет-сообщества в исследованиях фунда- 
ментальных проблем ИИ переоценить трудно, поскольку сложность и комплексность 
широкомасштабных научных работ требует такой же широкомасштабной координа- 
ции, проводимой консорциумом \!ЗС и начатой в свое время Тимом Бернерсом-Ли с 
официального обоснования семантического Веба [2]. В Украине развиваются старые 
признанные и создаются новые научные школы знание-ориентированных наук. 
Несмотря на минимальное финансирование и пассивность государства в плане под- 
держки исследовательских программ научные центры Киева, Харькова, Донецка за 
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последние 10-15 лет осуществили ряд серьезных теоретических и практических разра- 
боток в этой области. Особо интенсивное развитие получило направление формаль- 
ных компьютерных онтологий. 

Обобщение основных концепций онтологического подхода дает возможность ос- 
мыслить его роль и составные элементы в рамках общей теории ИИ. Упоминание роли 
онтологий относительно развития теории ИИ не случайно, поскольку именно онтологии 
по определению представляют собой методологию и инструмент описания сущностей и 
природы бытия, в том числе знаний и метазнаний. Понятие онтологии в информатике 
характеризует попытку всеобъемлющей и детальной формализации некоторой области 
знаний с помощью прозрачной логической концептуальной схемы. Применительно к ИИ 
онтология определяется как форма представления знаний о реальном мире или его фраг- 
ментов (что и зафиксировано в компьютерной энциклопедии [3]). Естественно, что стро- 
гого и единственно правильного определения онтологии мы не найдем, поскольку эта 
научная область в данное время интенсивно формируется силами многих ученых-инфор- 
матиков со всего мира со своими субъективными точками зрения. В итоге можно 
собрать целое множество определений онтологии, которые частично пересекаются и во 
многом отличаются друг от друга, большей частью ориентируясь на отдельные стороны и 
специфические свойства интеллектуальных систем. При этом главным, на наш взгляд, в 
онтологическом подходе является то, что объединяет большинство разделов теории ИИ и 
этим общим является понятие базы знаний. Иными словами, онтологии позволяют фор- 
мализовать и компактно представлять накопленные знания, одновременно определяя и 
объединяя терминологию различных предметных областей, строить единую научную 
картину мира как результат комплексных трансдисциплинарных исследований. Более 
того, в некоторых публикациях [4] онтологии, рассматриваемые в структуре семантичес- 
кого Веба, напрямую отождествляются с универсальными базами знаний. При таком под- 
ходе база знаний представляет собой описание понятийного аппарата определенных 
предметных областей, допускающее последовательные трансформации представлений 
знаний в формах, ориентированных на восприятие и использование мультиагентными 
интеллектуальными информационными системами. 

Архитектура онтологии в обобщенном виде базируется на трех составных — универ- 
сальной языковой основе (ХМГ), методологической модели описания информационных 
ресурсов (КПОЕ) и, собственно, на языке описания онтологий (О\\Т.). Представленная на 
рис. 1 модель базы знаний (БЗ) в виде онтологий демонстрирует их составные элементы и 
их место в Интернете. Графически в динамике показано, что семантический Веб является 
частью традиционного Интернета, его трансформацией через расширение сегмента онто- 
логий. В свою очередь, онтологическая составная отображается на основе трехуровневой 
модели баз знаний в виде ХМГ-, ВОЕ- и О\УТ-компонентов, которые и являются 
приложениями в разных областях ИИ. Из рис. 1 видно, что допускаются также различные 
сочетания составных семантического и традиционного Веба, поскольку процесс транс- 
формации и наполнения онтологий эволюционный и охватывает не только Веб, но и 
другие сегменты Интернета. В качестве такого примера может рассматриваться появ- 
ление в группах новостей В$З-систем, которые также используют ХМГ-базис. 

Реализации онтологических проектов поддерживаются во многих исследователь- 
ских учреждениях и вузах Украины. В данном контексте можно назвать как научно- 
исследовательские, так и образовательно-учебные исследования, различие между которыми 
достаточно условно. 

Так, в ИК НАНУ в течение ряда лет в рамках академической тематики развивается 
направление знание-ориентированных систем, в котором представлены принципы 
построения онтолого-управляемых информационных систем с реконфигурируемой архи- 
тектурой, методы онтологического анализа естественно-языковых текстов на предмет 
извлечения из них знаний, прикладные аспекты онтологий, в частности, для разработки 
электронных учебных курсов, метаонтологии и системы интеграции знаний в трансдис- 
циплинарных областях и др. [5-7] [8]. 


«Штучний 1нтелект» 32008 92 


5П Палагин А.В., Риппа С.П., Саченко А.А. 


Еще один проект по разработке Веб-онтологий как средств обмена данными и 
поддержки решений для улучшения экономического сотрудничества между Украиной и 
США финансировался М№Е и выполнялся в 2004-2007 гг. НИИ интеллектуальных 
компьютерных систем (НИИ ИКС) Тернопольского Национального экономического уни- 
верситета совместно с Ме\м ]егзеу шзивие оЁ Тесппо]озу, ОЗА [9]. 
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Рисунок 1 — Обобщенное представление архитектуры и составляющих 
семантического Веба 


Следующих два актуальных проекта, о которых целесообразно упомянуть под- 
робнее, осуществляются совместными усилиями Научно-исследовательского центра 
по проблемам налогообложения Национального университета ГНС Украины и НИИ 
ИКС: первый — создание системы электронного аудита налоговых деклараций [10] и 
второй — разработка методологии трансфера знаний в сфере Компьютинга (компьютерные 
науки, компьютерная инженерия, программная инженерия, информационные системы и 
технологии, в том числе и в экономике) для содействия мобильности студентов и внедре- 
ния дистанционного обучения в рамках международных образовательных стандартов [11]. 

В первом проекте усилия разработчиков сосредоточены на создании инструмен- 
тальных средств поддержки в Интернете системы электронной налоговой отчетности и 
аудита на основе онтологий. Начиная с 2006 года, в системе налоговой службы Украины 
внедряется ХМГ-ориентированная отчетность налоговых деклараций, используя которую 
в качестве первичных таксономий предметной области «Электронная налоговая отчет- 
ность и аудит», становится возможным описание информационных ресурсов деклараций и 
методики их аудита в Интернете (КОЕ-составляющая). База знаний первых двух уровней 
(ХМГ- и КОЕ-описания) используется для формирования инструментальных средств 
формализации и поддержки онтологии «Электронного налогового аудита» в системе ор- 
ганов Государственной налоговой службы (ГНС), использование которых обеспечивает 
расчет и экспресс-анализ показателей налоговой нагрузки. Программная поддержка онто- 
логии для оценки налоговой нагрузки осуществляется совокупностью мультиагентных 
модулей с применением /Лауа-скриптинга для выполнения ХЗГТ-преобразований. Особен- 
ностью реализуемого проекта является ориентация онтологии на проектирование всей 
системы в среде дистанционного обучения (СДО «Прометей»), которая, с одной стороны, 
содействует внедрению знание-базированной технологии реформирования деятельности 
органов ГНС, а с другой стороны, включает модули для плательщиков налогов, осущест- 
вляя процесс их обучения и адаптации к системе электронной налоговой отчетности [12]. 

Актуальность второго проекта подчеркивает тот факт, что одной из ключевых 
проблем для вхождения Украины в открытую американскую и европейскую образова- 
тельную среду является перевод украинских университетов на систему зачетных креди- 
тов, способную обеспечить приемлемый способ измерения, и сопоставление результатов 
учебы в трансфертных процессах знаний для студентов и ученых при переходе и взаимо- 
действии между разными национальными университетами и вузами. Кредитная система 
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ЕСТЗ (Еигореап Стед ТгапзЕег Зузет) позволяет проводить структуризацию учебных 
планов университетов разных стран Европы с целью обеспечения их совместимости, 
однако, если сравнение дисциплин учебных планов с разными единицами измерения на- 
грузки можно достаточно легко осуществить с помощью предварительного перевода 
нагрузки в систему ЕСТЗ, то проведение качественной оценки является достаточно 
трудоемким процессом вследствие актуальности проблемы формализации данной пред- 
метной области. Анализ показывает, что одним из наиболее эффективных путей решения 
указанной проблемы является применение онтологий, активизация исследования которых 
стремительно нарастает в последние годы. 

В процессе реализации указанного проекта предложен подход, основанный на сравни- 
тельном анализе содержания университетских учебных планов и программ по Компью- 
тингу с использованием онтологии как инструмента их формализованного описания. При 
этом основное внимание уделяется не формальному перечислению кредитов из учебных 
планов с разными единицами нагрузки (как, например, ЕСТЗ), а определению количест- 
венной оценки сравнения дисциплин на основе анализа их содержания. Известно, что 
предметная область (область знаний) Компьютинга может быть разделена иерархически 
на подмножества разделов знаний (отдельных блоков знаний — дисциплин), которые, в 
свою очередь, дифференцируются на тематические модули (дисциплины), причем каж- 
дый модуль включает набор подразделов дисциплин (тем). Когда рассматриваем процесс 
разработки онтологии, в данном случае ключевыми стадиями являются концептуализация 
и формализация. На этапе концептуализации онтологии проводится содержательный ана- 
лиз блоков знаний и определение основных понятий, их взаимосвязи и свойства (учебные 
планы, дисциплины, виды отчетности, учебной нагрузки, этапы учебы, блок дисциплин, 
структура и характеристики учебного плана). На этапе формализации онтологии выпол- 
няется формализация основных понятий и определяются способы интерпретации знаний. 
При этом для описания декларативных знаний представилось целесообразным использо- 
вать семантические сети и фреймы, а для представления процедурных знаний — про- 
цедурные и формально-логические модели с использованием методов концептуализации 
образовательных знаний и привлечением аппарата универсальных языков и таксономий. 
Таким образом, онтология отображает семантику области знаний, а сами семантические 
сети обеспечивают представления знаний в виде ориентированного графа, вершины 
которого содержат основные понятия из соответствующих дисциплин, а дуги иллюстри- 
руют взаимосвязи между ними. Кроме того, предусмотрена разработка составной онтоло- 
гии представления знаний по учебным планам, конечным этапом которой является 
описание методологии трансфера знаний по Компьютингу. 

Описанный подход частично реализуется на сервере дистанционной учебы [12], кото- 
рый поддерживается совместно Национальным университетом Государственной налого- 
вой службы Украины и Тернопольским национальным экономическим университетом. 
Ожидается, что результаты исследования будут иметь значение для сферы Компьютинга 
в системе высшего образования как Украины, так США и Европы, потому что они 
предоставляют формальный инструмент сопоставимости содержания учебных планов и 
программ дисциплин и, таким образом, обеспечивают возможность трансферта знаний в 
данной сфере вместо механического перезачета кредитов, как это осуществлялось ранее. 
Указанный подход позволяет интенсифицировать работы по согласованию образователь- 
ных стандартов Украины и США, а также стран Европы и, на основе семантического 
перезачета кредитов, придает более осмысленный характер мобильности студентов. 

Исследовательский процесс онтологических подходов в теории знание-ориентиро- 
ванных наук, как любая исследовательская область, характеризуется множеством про- 
блем и нерешенных задач. Одной из них является необходимость концептуализации 
метаонтологий или метазнаний в области ИИ. И действительно, за редким исключением, 
большинство проектов в сфере онтологий после декларирования принципов семантичес- 
кого Веба и построения его отдельных, условных фрагментов продолжаются традицион- 
ными средствами гипертекстовых систем и технологий программирования. 


«Штучний 1нтелект» 32008 977 


5П Палагин А.В., Риппа С.П., Саченко А.А. 


Другой нерешенной проблемой можно считать противоречие в сфере правового 
регулирования лицензионных вопросов создания и поддержки информационных и прог- 
раммных систем. Тут идет речь о конкурентной борьбе так называемых «открытых и 
закрытых систем». Общепризнано, что коммерческие лицензии на одноразовую покупку 
программного обеспечения является достаточно сильным сдерживающим фактором про- 
гресса информационных технологий. Данную ситуацию иногда сравнивают с необходи- 
мостью для каждого нового велосипедиста повторно изобретать велосипед. Для научного 
сообщества очевидны преимущества открытых систем, которые совершенствуются и раз- 
виваются общими усилиями в среде глобального информационного общества. Сегодня 
уже понятно, причем не только интуитивно, но и по результатам развития знание- 
ориентированных наук, что различные методы регулирования лицензионных аспектов 
применения информационных систем, в том числе интеллектуальных, могут в значитель- 
ной мере ускорять или замедлять развитие целых научных сфер. 

Перечень методологических проблем и нерешенных задач в области онтологий 
можно продолжить. Например, отсутствие приемлемого теоретического обоснования 
инструментальной реализации онтологических систем, поскольку большинство проектов 
в этой сфере поддерживаются традиционными технологиями программирования и Веб. 
Похожие проблемы характеризуют теоретические аспекты создания интеллектуальных 
мультиагентных и Веб-сервисных систем, ориентированных на семантический Интернет. 
Таким образом, обобщение большинства названных проблемных вопросов дает воз- 
можность выделить ключевую сущность, объединяющую разнообразные онтологии в 
области ИИ. Эта сущность материализуется в понятии базы знаний, которая с расши- 
рением интеллектуальных технологий в Интернете, трансформацией его в семантический 
Веб, приобретает в такой новой Сети универсальные выразительные возможности, ове- 
ществляясь в онтологиях. 
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Рисунок 2 — Междисциплинарный характер онтологий в научных исследованиях 


Подводя итог, можно представить онтологии на рис. 2 не просто в виде составных 
компонентов, а как универсальный инструмент междисциплинарных научных исследова- 
ний в виде пирамиды наиболее важных обобщенных функций знание-базированных 
систем, которые были концептуально охарактеризованы на примере рассмотренных проек- 
тов или описаны в терминах проблем и нерешенных задач в сфере интеллектуальных 
систем. Средний (знания) и верхний уровни (метазнания) являются необходимыми и до- 
статочными элементами целостной теории баз знаний, которая формируется как концеп- 
ция онтологий и одновременно выступает действенным и практическим инструментом в 
современном Интернете, понимаемом и воспринимаемым уже как семантический Веб в 
широком междисциплинарном смысле. 
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Выводы 


1. Показано, что исходной доминантой исследований семантического Веба как рас- 
ширяющейся составляющей традиционного мультимедийного Интернет-контента стали 
теоретические положения онтологий и баз знаний. На этой основе обобщены концепции 
развития знание-ориентированных разделов наук ИИ и обосновано для них значение 
онтологий в трансдисциплинарном исследовательском контексте. 

2. Предложена пирамидальная модель онтологического обеспечения исследований 
и разработок в сфере информационных систем и технологий, которая позволяет концеп- 
туализировать архитектуру семантического Веба на двух уровнях: на первом — знания в 
виде онтологоуправляемых информационных систем, на втором — метазнания в процессе 
интеграции онтологий и баз знаний. Представленная модель подкреплена перечнем 
выполненных и актуальных проектов в области семантического Веба, которые реали- 
зованы силами исследовательских лабораторий НАНУ и вузов Украины. 
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Стаття присвячена аналзу та узагальненню концептуальних засад застосування онтоломй в процесах 
створення 1нформашйних систем. Розглядаються склад 1 архитектура онтоломй як основи семантичного Вебу, 
в якому особлива увага придляеться поняттю баз знань як центрального компоненту 1нтелектуально! 
иформащйно! системи в [нтернет!. Наведен! приклади виконаних 1 актуальних проекив з тематики 
онтолопй, як! реалзуються в академчних лабораториях 1 вузах Украни, сформульован! також основн! 
проблеми у сфер! знання-ортентованих систем 1 напрями 1х розв’язання. 
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